Combinaison de ressources générales pour une contextualisation implicite de requêtes (Query Contextualization and Reformulation by Combining External Corpora) [in French]
نویسندگان
چکیده
Query Contextualization and Reformulation by Combining External Corpora Improving document retrieval using external sources of information has been extensively studied throughout the past. Improvements with either structured or large corpora have been reported. However, in these studies resources are often used separately and rarely combined together. We present an evaluation of the combination of four different scalable corpora over a web search task. An informative divergence measure is used to extract contextual features from the corpora and improve query representation. We use the ClueWeb09 collection along with TREC’s Web Track topics for the purpose of our evaluation. Best results are achieved when combining all four corpora, and are significantly better than the results of other approaches. MOTS-CLÉS : Combinaison de ressources, RI contextuelle, recherche web.
منابع مشابه
Une Approche Ontologique d'Intégration de Sources de Données dans un Environnement de Pair à Pair
Résumé. Les systèmes pair à pair (P2P) sont des systèmes à grande échelle, auto-organisés et répartis. Ils permettent la gestion des ressources de manière totalement décentralisée. Cependant, l'intégration sémantique des données structurées, hétérogènes et distribuées à travers ces systèmes s'avère un problème complexe. L'objectif de ce travail consiste à proposer une approche dirigée par la sé...
متن کاملRoutage sémantique des requêtes dans les systèmes pair-à-pair
RÉSUMÉ. Les systèmes pair-à-pair (P2P) se sont imposés ces dernières années comme la technologie majeure d’accès à différentes ressources sur Internet. De nombreuses recherche concernant la sélection des meilleurs pairs contenant les données appropriées à une requête,ont émergé et constituent un axe de recherche très actif. L’efficacité de la recherche dans ces systèmes, et surtout le cas non s...
متن کاملUtilisation des ressources externes pour la reformulation des requêtes dans un système de recherche d'information
Dans un Système de Recherche d’Information (SRI), les démarches pour la reformulation de la requête sont nombreuses. Elles peuvent être classées selon les ressources utilisées en trois grandes approches : l’utilisation des ressources externes, l’analyse globale et l’analyse locale. Dans ce contexte et dans le cadre des SRI pour les textes Arabes, nous nous intéressons à l’évaluation des perform...
متن کاملLes défis posés par le Web sémantique
RÉSUMÉ. Le Web sémantique est une vision du Web de demain où l'interopérabilité entre les ressources distribuées sur le Web, aujourd'hui très hétérogènes, sera facilitée par un marquage sémantique de ces ressources à l'aide d'ontologies. Une ontologie est un vocabulaire structuré de noms de concepts et de propriétés définis précisément à l'aide d'un langage formel non ambigu. Dans la vision du ...
متن کاملExploiting Wikipedia Structure for Short Query Expansion in Cultural Heritage
This paper deals with the short and precise queries problem. Short and precise queries do not have sufficient information to be non ambiguous. Pseudo-relevance feedback (PRF) is an effective technique to improve retrieval performance by expanding a user query. However, this collection based expansion method does not work well in the case of short queries. Therefore, we present instead of PRF, a...
متن کامل